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Каледин. Артем @ билайн 
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№ 


2, 


| риемы повышения точности 
геолокациит 


ефонов’ на. сети _ 


|| | | \ 
| ) | \ \ 
В \ 


ВА 


О спикере 


№ 


ВМК МС @ МГУ 
1й выпуск МАОЕ @ УК 


> 5 лет в анализе данных 


Делал проекты с гео в банках, 
телекомах, для такси/курьеров и 
маркетплейсов 


Работал в логистическом стартапе и 
строил модельки для Икеи 


вре 


Сколько базовых 


Ф 


И/7 2225 


и 
— 


” $55 р, 
„22? >>>27227144 и“ 


— 
- - -- 


План доклада 


1 Какую задачу решаем, 
какие данные используем, 
что такое БС, где 
применяем решение 


3 Графы и гексагоны 


Базовые подходы по 
имеющимся данным и 
проблемы, с которыми 
столкнулись 


Что использовали и 
следующие шаги 


(но) ННЕоаа"" 


Какая ценность решения задачи 
внутри билайн 


о Нагрузка на сеть и планирование Ссылка на открытое 
развития сети решение 


део-пмегасе.сот/ 


(©): <-.: (@) 


(@).г 
(нь) НЕНЕоаа"* 


9 «Точки притяжения» абонентов 


В2В на обезличенных данных: открытие 
торговых точек и проходимость зон 


Социальная деятельность 
с ЛизаАлерт 


* билайн.поиск — платформа на основе анализа 
больших данных, где приходит смс «свидетелям 
пропажи» человека 


нейросеть Вее!те А! — ИИ отсматривает фото, 
полученные с дронов во время поисковой 
операции, и ищет на них пропавшего человека 


пилот с Пятерочкой в Москве для настройки 
сообщений на удалённых рекламных носителях о 
пропавших людях в зоне нахождения магазина 


(не) Ннисаа" 


Мы работаем не с СР, 
а со вспышками 


И они есть везде! 


Магазины Банки 
Заказы в конкретные пункты Информация с РОЗ- 
выдачи и посещения терминалов и входы в 
магазинов мобильные приложения 
= Такси/курьеры ГЕ И 
Заказы, рестораны, места = Впишите свой бизнес и какие 


подачи и окончания поездок у вас есть гео-данные 


(не) Ниньоаа" 


Базовая станция 


Это комплекс антенн, которые 
принимают и передают сигналы от 
телефона к телефону. 


‹ Высота крепления — радиус покрытия 


* Много пользователей — высокая пропускная 
способность 


Какие БС бывают? 


(но) ННЕоаа"" 


Какие есть данные 


ГАС СЕБЕ [аб оп 
Код местности Код базовой станции Координаты БС 
(ГосаНоп Агеа Соае) (сота) 

Зона свечения Для валидации 

(сектор) СР5$-треки драйв-тестов 


ь | (НЕ) Наньоаа" 


Гео = круто 


© 


Много данных 


Частичная открытость 


Пробки, ОЗМ, индекс привлекательности 
мест, цены на недвижимость 


Деперсонализированность и 
агрегационная способность 


Нам не интересен конкретный клиент для открытия 
новой точки — нам интересно их количество 


(но) ННЕоаа"" 


Триангуляция — вычислим 
ли точный адрес? 


Триангуляция — разбиение 
геометрического объекта на 
симплексы 

\®) - Объект 


В случае плоскости — разбиение на 
треугольники 


1км - Расстояние до 
объекта 


% - Базовые станции 


В сотовой связи — вершины заданы 
координатами базовых станций 


ь (не) Ненсаа" 


Триангуляция — вычислим 
ли точный адрес? 


Минусы: 


— Перегруженность БС и перескоки 


— Преломление сигнала и замер 


9 - Объект 
фактического расстояния 


1км - Расстояние до 
объекта 


— Высокая погрешность. Не видим 
абонентов на подконтрольной 
территории 


Уч - Базовые станции 


. (не) Ненсаа" 


Какие есть данные 


ГАС СЕБЕ [аб оп 
Код местности Код базовой станции Координаты БС 
(ГосаНоп Агеа Соае) (сота) 

Зона свечения Для валидации 

(сектор) СР5$-треки драйв-тестов 


ы | (НЕ) Наньоаа" 


Как бы вы решали эту задачу? 


(но) ННЕоаа"* 


1. Каждая координата БС - итоговая 
локация 


О БС (3) Число вспышек на БС 
`` Переключения \Г @РЗ-трек 


Е >) 
(2 - — 
к = = 
<= 1 |". 
о к ` 
\. № - 
— рые 


Е 


Примеры треков 
16 


(но) НЕНЕоаа** 


Как считаем 
метрики? 


1 Берем временное окно заданной 
длины 


Агрегируем данные по с + 1$ 
мипао\м/ (обычно данные приходят 
каждую секунду => получаем 
истинное значение в окне) 


3 Считаем медианные координаты 
для окна 


Науегзте 


д Считаем расстояние по хаверсинусу 


— ыы 


92—91 
5 


а=2х агсвйа| \/ в | + со5( $1 )соз( $2 эешо | 


17 


997 


Хорошая 
геопозиция! 


у 9 
И ° 


9 | 


9 


9 


(но) НН оаа* 


Агрегация по временным окнам: 


2. Усреднение координат БС 


Формула 
1авз1 + [а з2 +... азк/ М 
|ОПвз1 + [ОПЙвз2 +... [ОЙвем / М 


Примем значение 
метрики для этого 
случая за бейзлайн 


в (не) Нина" 


Агрегация по временным окнам: 


3. Взвешенное по времени усреднение 
координат БС 


Добавляем веса вида 
ЧМАи м 1Д 


В 29% случаев 
метрика лучше 
бейзлайна 


В 1.35 раз 


в среднем 
расстояние меньше 


ь (не) Неноаа" 


Агрегация по временным окнам: 


4. Взвешенное усреднение координат 
БС 


Добавляем веса вида 
1/ спи Ш 1/сп 


+ решаем линейной моделью 


В 24% случаев 
метрика лучше 
бейзлайна 


В 1.9 раз 


в среднем 
расстояние меньше 


о (не) Ненисаа" 


ауд 
{те 
мед 


Агрегация по временным окнам: 


5. Определение топ БС 


Наименьшее расстояние 
до других БС 


{те ауд 
В 37% случаев 
метрика лучше 
бейзлайна 
Фе О В 1.8 раз 
РТИ в среднем расстояние 
У" меньше 


ь (не) Ненсаа" 


Сравнение методов 


Название Взвешенное 
Усреднение 
алгоритма по времени 


Доля наилучших 
результатов 


44 % 9 % 


22 


Взвешенное 
по счетчикам 


16 % 


Топ БС 


31 % 


(нь) ННЕоаа"" 


Обработка свечений: 


1. Центроид пары 
пересечений БС 


. Попарно рассматриваем пересечения 
покрытий БС 


. Выбираем наибольшее парное 
пересечение 


Считаем центроид образовавшейся 
геометрии 


2 


А 


Пересечение двух Пример 3 се! 
БС для 1 ас и их 
пересечение 


Пример теор. и факт. покрытий 


(но) ННЕоаа"" 


Обработка свечений: 


2. Усреднение центроидов 
геометрии 


В 43% случаев 
метрика лучше бейзлайна 


В 1.6 раз 
в среднем расстояние 
меньше 


ор 6$ 
ауа сепиго! 
++ 
Нё>ИГоаа ** 
24 (но) НБ 


Обработка свечений: 


3. Центроид геометрии топ БС 


кУРЬЯНрвО 


{ор сепиою 


25 


В 19% случаев 
метрика лучше бейзлайна 


В 1.8 раз 


в среднем расстояние 
меньше 


(но) ННГоаа"" 


Сравнение методов 


Название Взвешенное 
Усреднение 

алгоритма по времени 

Доля 

наилучших 21 % 7% 

результатов 
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Взвешенное 
по счетчикам 


12 % 


Топ БС 


17 % 


ТопБС — Усреднение Линейные 
центроид центроидов веса 
7% 19 % 17 % 


(нь) ННЕоаа"" 


4. Проекция координат БС на граф 


Обработка свечений базовых 
станций 


° Знаем покрытие БС 


. Берем дорожный граф в этой зоне 


» Проецируем координаты БС 
на вершины графа 


Делаем БиНег, чтобы 
нашлись точки на 


графе 


27 


(но) ННЕоаа"" 


Построение маршрутов для графа 


дорог 


Пытаемся восстановить по 
ребрам и вершинам 
дорожного графа маршрут 
через БС 


Проецируем свечение БС или координату 
расположения на граф и строим 
кратчайший путь до следующих БС, тем 
самым создавая возможный трек 
абонента 


28 


(но) ННЕоаа"" 


Построение маршрутов для графа 
дорог 


Пытаемся восстановить по 
ребрам и вершинам 
дорожного графа маршрут 
через БС 


Проецируем свечение БС или координату 
расположения на граф и строим 
кратчайший путь до следующих БС, тем 
самым создавая возможный трек 


абонента 


Факт 


В среднем работает на 15% лучше, чем Прогноз 


прошлые методы, но вычислительно ++ ь 
дорого (но) НИЕНГоаа 


Как считаем 
метрики? 


1 На отрезке имеем два трека — 
оригинальный и восстановленный 


о Считаем долю перекрытых областей 


В зонах отличий считаем среднюю 
ошибку по хаверсинусу 


Чассага 


|ицегзес Юп 


ТЗ 
и 


поп 


30 605 


997 


Хорошая 
геопозиция! 


у 9 
И ° 


9 


9 


(но) НН оаа* 


вре 


Сколько базовых 
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И/7 2225 


и 
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С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные 
преобразования и фильтр Калмана 


ь (не) Ненсаа" 


С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные 
преобразования и фильтр Калмана 


о Сдвиги по времени 


33 


(но) ННЕоаа"* 


С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные / 
преобразования и фильтр Калмана ] 


о Сдвиги по времени 


Запаздывание 


34 (нь) НЕНГоаа ++ 


С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные 
преобразования и фильтр Калмана 


о Сдвиги по времени 


о Выбросы 


Очевидные 


ь (не) Ненисаа" 


С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные 
преобразования и фильтр Калмана 


о Сдвиги по времени 


о Выбросы 
ы Фактические расположения БС друг К 

другу и практические переключения БС к © 8) 8 ы 

\\ х [5 6) 5 

@ < х переключения 

79 (8 ь |5) @9 | 7“ д 

@ [С (5) © — © \ >) 

© у Аб 

@) 689 


(зд 


ь (Не) Ненисаа" 


С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные 
преобразования и фильтр Калмана 


о Сдвиги по времени 


о Выбросы 
ы Фактические расположения БС друг К 

другу и практические переключения БС к © 8) 8 ы 

\\ х 5) 69) 5 

@ й х переключения 

79 (8 ь |5) @9 | 7“ д 

@ [С (5) © — © \ >) 

© у Аб 

@) 689 


(зд 


ы (Не) Ненисаа" 


С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные 
преобразования и фильтр Калмана 


о Сдвиги по времени 
о Выбросы 


‹ Фактические расположения БС друг к 
другу и практические переключения БС 


* Отсечение топ М БС по расстояниям 


” (не) Ненисаа" 


С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные 
преобразования и фильтр Калмана 


о Сдвиги по времени 
о Выбросы 


* Фактические расположения БС друг к 
другу и практические переключения БС 
* Отсечение топ М БС по расстояниям 


* Отсечение по медианному расстоянию. 
Анализ ошибок по районам и зашивание 
доли в район 


39 


С какими проблемами 
сталкиваемся 


о Выбросы по СР$ — линейные 
преобразования и фильтр Калмана 


о Сдвиги по времени 
о Выбросы 
* Фактические расположения БС друг к 
другу и практические переключения БС 
* Отсечение топ М БС по расстояниям 


* Отсечение по медианному расстоянию. 
Анализ ошибок по районам и зашивание 
доли в район 


. Пересечение проекций + изохроны 


” (не) Ненсаа" 


вре 


Сколько базовых 


Ф 


И/7 2225 


и 
— 


” $55 р, 
„22? >>>27227144 и“ 


— 
- - -- 


Точка притяжения 


Место, в котором абонент проводит свое время (дом, работа, встречи с 
родственниками и друзьями) 


Ее основные характеристики — регулярность и продолжительность 
нахождения в окрестности 


42 


(но) ННЕоаа"" 


Парадигма З1ау/Моуе 


Точка притяжения 


Место, в котором абонент проводит свое время (дом, работа, встречи с 
родственниками и друзьями) 


Ее основные характеристики — регулярность и продолжительность 
нахождения в окрестности 


Зау Моуе 

Точки притяжения и разовые активности Дороги, метро ит.д. 

абонент находится в состоянии покоя и абонент находится в состоянии движения, 
никуда не перемещается, но может обычно цель этого передвижения — 
переключаться между соседними БС добраться до другой точки притяжения 


и (не) Неньсаа" 


Как определить, на чем перемещается 
абонент? 


. Оценка скорости перемещения по переключению между БС 


Сегментация БС — дороги, тдоог, высота подвеса и 
обслуживаемая зона 


. Выделение маршрутов общественного транспорта и 
сопоставление маршрутов с перемещением абонента 


В3 шаех Автомагистраль Парк Коммерческая зона Школа 
8а11818089а7 1 1 0 1 0 
8а11818090а71 0 1 1 0 
8а11818091а7 1 0 0 0 1 


++ 
8а11818092а7 0 0 0 0 (но) НзНГоаа** 
2022 


Что происходит с перемещениями? 


Рассмотрим подробнее 
перемещение на авто 


© 
При перемещениях мы можем предугадывать точку к 
назначения и прогнозировать путь 
За счет справочника соседства (фактического и у * 
эмпирического) можем предсказывать набор й © 
следующих БС (де-факто марковские цепи) \ 
Движение по Съезд 


магистрали 


ь (Не) Нанисаа" 


Что происходит с перемещениями? 


Рассмотрим подробнее 
перемещение на авто 


При перемещениях мы можем предугадывать точку 
назначения и прогнозировать путь 


° За счет справочника соседства (фактического и 


и 
эмпирического) можем предсказывать набор й © 
следующих БС (де-факто марковские цепи) \ 

. я каждого расположения существуют степени 
Дл - р о у Движение по Съезд 


свободы — куда может перемещаться абонент 
магистрали 


ь (не) Нансаа" 


Гексагональный дорожный 
граф 


В состоянии движения нам не 
так важно, по какой именно 
дороге движется абонент 


Граф тяжелый и ребра — ломанные => Упрощаем 
структуру и переходим на гексы 


ь (не) Ннисаа" 


Гексагональный дорожный 
граф 


В состоянии движения нам не 
так важно, по какой именно 
дороге движется абонент 


Граф тяжелый и ребра — ломанные => Упрощаем 
структуру и переходим на гексы 


1. Отсечем в подложке основные дороги 


48 


Свечение БС 
Дорожные гексы 


(но) ННЕоаа"" 


Гексагональный дорожный 
граф 


В состоянии движения нам не Ч обоя 


так важно, по какой именно ой Е Я 
дороге движется абонент ЗаННЯ АННО 


Граф тяжелый и ребра — ломанные => Упрощаем 
структуру и переходим на гексы 


. 
ото @ › В 
Ф 
* 


1. Отсечем в подложке основные дороги 


2. Для каждого гекса берем соседние и соединяем 
ребрами 


ь (не) Ниньоаа" 


Дорожные гексы 
Пересечение свечения 


Гексагональный дорожный 
граф 


В состоянии движения нам не 
так важно, по какой именно 
дороге движется абонент 


Граф тяжелый и ребра — ломанные => Упрощаем 
структуру и переходим на гексы 


1. Отсечем в подложке основные дороги 


2. Для каждого гекса берем соседние и соединяем 
ребрами 


3. Получаем новый граф, где вершина — центроид 


++ 
гексагона (но) НзНГоаа** 
2022 
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Схема построе 
ния гексагональн 
ет (ео) 


51 г 
(но) ННЕоаа"* 
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Пример дорожных гексов и дорог 


Новые ребра 


(но) ННЕоаа"" 


в” › © 


Пример дорожных гексов и дорог Новые ребра 


ваз 


Простейший граф с Учет дорог Ориентированный 
соединением соседних вершин взвешенный граф 


53 


(но) ННЕоаа"" 


Ориентированный гексагональный 
дорожный граф 


среднее время / расстояние между 
комбинациями вершин 


Создаем промежуточные Проецируем на 


++ 
вершины и считаем центроиды - новые (но) НЕНоаа* 
ыы время вершины — 


Ориентированный гексагональный 
дорожный граф 


ев 
Е) 
А- 


иле 
49; 
вх 


1 Для каждой вершины графа в 
гексагоне смотрим соседние 
вершины 


РАНЕ 
< 5 ы 


а 


2 Для каждого гексагона попарно с 
соседним гексагоном берем подграф 
и считаем времена достижимости 


55 (но) ННГоая ый 


Как здесь считается ошибка 


1. Считаем количество гексов между прогнозируемым 
и оригинальным маршрутом 


2. Далее для заданного размера сетки считаем 
среднее расстояние между 2 гексами 


3. Умножаем их число на это значение 


СР$ 
Прогноз 


МО$СО\ 
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НЕ) ННГоаа 


Как здесь считается ошибка 


1. Считаем количество гексов между прогнозируемым 
и оригинальным маршрутом 


2. Далее для заданного размера сетки считаем 
среднее расстояние между 2 гексами 


3. Умножаем их число на это значение 


СР$ 
Прогноз 


МО$СОМ/ Добились заявленного графового 


улучшения и получили быстрый 
рабочий метод 


| ЧН нмна- 


Мех Зерз$ 


1 Более детальный 
учет сегментации БС 
и точек притяжения 


58 


Учет временных к. 
факторов, пробок 

и скорости 

перемещения 


Оптимизация 
расчетов 
маршрутов 

и использование 
предрассчитанных 
параметров 


(но) ННЕоаа"" 


Что мы использовали в проекте 


+ ПЗ 10$ ЮЗ йит + озт 
+ чаг$ пемогкх 

озтих 

элареу 

эсру.зрана! 


ь (не) Ненисаа" 


О чем сегодня поговорили? 
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Как работать с 
нерегулярными событиями 


Как строить маршруты по 
таким цепочкам 


Как удалять выбросы и 
выделять основную гео- 
информацию 


И как это делать быстрее и 
проще 


(но) ННЕоаа"" 


онтакты 
Каледи н Арт тем 


АМКае:  ебее[пеу ве 
Аукаече тай о | | 


Голосуйте за доклад 


ными 


Ориентированный гексагональный дорожный 


граф: описание шагов 


1. Для каждой вершины графа в гексагоне смотрим соседние вершины 
А. Если вершина находится в соседнем гексе => ОК 


В. Иначе => разбиваем ребро на линии и по ним создаем 
промежуточные точки в каждом гексагоне, чтобы построить 
гексагональные ребра 


С. Считаем время и расстояние, просто поделив на число гексагонов, 
либо производим расчет времени и расстояний по парам точек через 
маршрутизатор 


2. Для каждого гексагона попарно с каждым соседним гексом возьмем 
подграф и рассчитаем по нему средние времена/расстояния достижимости 
и уже получим взвешенный гексагональный граф 
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(но) ННЕоаа"" 


